機器學習是一直很熱門的東西,大家一直瘋狂的討論,不過機器學習其實是可以再細分成三大部分的喔,可以分成:監督式、非監督式和強化式學習。
First:監督式學習(Supervised learning)
這個方法從名字便可以看得出來,就是訓練它的時候,都會賦予它一個正確的答案,監督它有沒有答對,而迴歸和分類都是屬於監督式的學習,舉例像是影像辨識貓或者是狗的時候,這個就是分類的問題,先前會先告訴機器可能100張的蘋果和草莓的照片,這就是標籤,而標記出來的就等於是正確解答,那在日後訓練讀取照片時,就給電腦自己去分類,然後再對比正確答案後,彼此間所產生的誤差再做修正。
舉個生活一點的例子:好比小時候假如媽媽給你看100張蘋果和草莓的照片,結你抓錯特徵變成是說紅色的水果是就一定蘋果,那日後你都會把紅色的水果認為是蘋果了,這樣若遇到草莓就會認錯了,因此這個方法不一定是完美的。
Second: 非監督式學習 (Unsupervised Learning)
就跟上一個不一樣了,它變成不給予機器標籤後的正確資料,給電腦自己去尋找資料間彼此的關聯,可能某些特徵相似的會分成一群,因此會利用潛在的規則,去形成不同的群體,舉例像是給它籃球、蘋果、安全帽、箱子,那機器就會自行尋找規則,可能知道要分成兩類,一是形狀圓形的;二是方形的去分群,又或是以男生、女生去做區分類。
Third: 強化式學習 (Reinforcement Learning)
這個的方式就是指輸入資料,但是卻不給予答案的是或否,反而是讓機器從互動之中去學習,因為互動之後會得到正面或者是負面的回饋,如此一來,機器也會想要得到正面的回饋而去做修正上一次預期可能是負面回饋的地方,日漸變得有效率且高品質的行動。舉例來說,瑪莉歐的遊戲中馬力歐要會一直前進但是前方會有水管阻擋,上方可能會有石塊阻擋,那如此一來,透過強化式的學習,機器會自己去找尋最恰當的跳躍高度,每次去試若撞到水管就跳高一點,若撞到石塊就跳低一點,漸漸的機器就會去尋找一個最佳化的解答,以達到終點。
參考資料:
https://ai4dt.wordpress.com/2018/05/25/%E4%B8%89%E5%A4%A7%E9%A1%9E%E6%A9%9F%E5%99%A8%E5%AD%B8%E7%BF%92%EF%BC%9A%E7%9B%A3%E7%9D%A3%E5%BC%8F%E3%80%81%E5%BC%B7%E5%8C%96%E5%BC%8F%E3%80%81%E9%9D%9E%E7%9B%A3%E7%9D%A3%E5%BC%8F/
https://www.inside.com.tw/article/9945-machine-learning